MODIP: Optimización eficiente basada en modelos para políticas de difusión
Aprende cómo MODIP optimiza políticas de difusión con modelos predictivos y control de trayectorias. Resultados superiores en D4RL y RoboMimic.
Aprende cómo MODIP optimiza políticas de difusión con modelos predictivos y control de trayectorias. Resultados superiores en D4RL y RoboMimic.